الگوریتم تست تابع کرنل دلخواه بر روی یک دیتا ست، و تشخیص نویز های دیتاست

در مساله ی رگرسیون، برای curve fitting بر روی یک مجموعه داده، تابع کرنل (به عنوان مثال کرنل چند جمله ای، نمایی، ...) را بر روی داده ها اعمال نموده و با بررسی تابع خطای رگرسیون، به تحلیل مناسب بودن تابع کرنل انتخاب شده می پردازند. در این صورت با توجه به اینکه وجود یک دسته نویز (outlier) در داده ها منجر به افزایش خطای تابع کرنلی می شود، نمی توان تنها با بررسی تابع خطا به بررسی عملکرد کرنل پرداخت.

اگر بتوان نمایش گرافیکی ای از مجموعه داده ها داشت، می توان وجود outlier ها را با scatter کردن داده ها مشاهده نمود، آنها را حذف کرد و تابع کرنل را دوباره سنجید. اما اگر بُعد داده های ورودی زیاد باشد، روش نمایش گرافیکی راه حل مناسبی نخواهد بود. علاوه بر آن که استفاده از نمایش گرافیکی به منظور یافتن نویز، به معنای اتوماتیک نبودن روند حل مساله است.

این الگوریتم، مجموعه داده ها و کرنل دلخواهی را به عنوان ورودی دریافت کرده و با بررسی رفتار تغییر خطای داده ها، به جستجوی نویز ها می پردازد. سپس تعداد نویز های دیتاست تخمین زده شده و با حذف نویز، عملکرد کرنل مورد ارزیابی قرار می گیرد. فرمول های ارایه شده برای تخمین تعداد نویز، خود با استفاده از یک «تابع رگرسیون تمرین داده شده» بدست آمده است.

در نهایت با بررسی نسبت تعداد نویز به تعداد کل داده، عملکرد کرنل به درصد بیان می شود. بدین ترتیب که اگر این الگوریتم، (به عنوان مثال) ۷۰٪ داده ها را به عنوان نویز شناسایی کرد، مشخص می شود که عملکرد کرنل مناسب نبوده است.

روند توسعه ی الگوریتم در یک فایل پی دی اف گزارش توضیح داده شده است.

استفاده از این الگوریتم در فایل readme.txt و همچنین کامنت کد توضیح داده شده است.

نظر بدهید

توجه: HTML ترجمه نمی شود!
    بد           خوب

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Aliquam iaculis egestas laoreet. Etiam faucibus massa sed risus lacinia in vulputate dolor imperdiet. Curabitur pharetra, purus a commodo dignissim, sapien nulla tempus nisi, et varius nulla urna at arcu.Lorem ipsum dolor sit amet, consectetur adipiscing elit. Aliquam iaculis egestas laoreet. Etiam faucibus massa sed risus lacinia in vulputate dolor imperdiet. Curabitur pharetra, purus a commodo dignissim, sapien nulla tempus nisi, et varius nulla urna at arcuLorem ipsum dolor sit amet, consectetur adipiscing elit. Aliquam iaculis egestas laoreet. Etiam faucibus massa sed risus lacinia in vulputate dolor imperdiet. Curabitur pharetra, purus a commodo dignissim, sapien nulla tempus nisi, et varius nulla urna at arcu. 

الگوریتم تست تابع کرنل دلخواه بر روی یک دیتا ست، و تشخیص نویز های دیتاست

  • تولید کننده: مارکت کد
  • شناسنامه: الگوریتم تست تابع کرنل دلخواه بر روی یک دیتا ست، و تشخیص نویز ها
  • موجودی: در انبار
  • تاریخ: ۱۳۹۵-۰۸-۰۷
  • زبان برنامه نویسی: MATLAB
  • سفارش دهنده: علیرضا زمانیان
  • 1,067,110تومان
  • قیمت بدون مالیات: 979,000تومان

برچسب ها: machine_learning, curve_fitting, robust_regression, kernel_validation